Definición 10.1.1: El Vínculo Estadístico
Dos variables $X$ y $Y$ se consideran relacionadas si hay cualquier cambio en la distribución condicional de $Y$, dado $X = x$, al cambiar $x$. Por el contrario, un estado de "sin relación" es matemáticamente equivalente a la independencia de $X$ y $Y$.
Las variables $X$ y $Y$ son independientes si y solo si $f(y|x) = f(y)$ para todos los valores de $x$. Esto implica que la función de frecuencia relativa conjunta puede factorizarse como:
$$f(x, y) = f(x)f(y)$$
Por lo tanto, probar una relación es fundamentalmente una prueba de Independencia.
Mecanismos de Cambio
Una relación se identifica por cualquier cambio en la función de densidad condicional (como se muestra en la Figura 10.1.1). Esto incluye:
- Desplazamiento de la Media: El valor esperado $E(Y|X)$ cambia (el enfoque más común).
- Desplazamiento de la Varianza: La dispersión o incertidumbre de $Y$ depende de $X$ (heterocedasticidad).
- Cambio de Forma: La distribución general se transforma (por ejemplo, de simétrica a sesgada).
Establecer Causalidad a través del Diseño
Una relación estadística no implica causalidad. Para afirmar que $X causa $Y$, debemos tener en cuenta las variables de confusión mediante el Diseño de Experimentos:
- Tratamientos de Control: Proporciona una base de comparación.
- Efecto Placebo: Mitigación de la mejora percibida mediante tratamientos inactivos.
- Cegamiento: Usando experimentos ciegos (los receptores desconciertos) y experimentos doble ciegos (receptores y investigadores desconciertos) para eliminar sesgos.
- Bloqueo: Como se observa en Ejemplo 10.1.7, usamos variables de bloqueo ($W$, como la fertilidad del suelo) para asegurar que la relación entre el tipo de trigo ($X$) y el rendimiento ($Y$) no esté confundida por condiciones previas.